智能论文笔记

Multilevel Bayesian Deep Neural Networks

Neil K. Chada , Ajay Jasra , Kody J. H. Law , Sumeetpal S. Singh

分类： (统计)机器学习

2022-03-24

在本文中，我们考虑了贝叶斯（DNNS），尤其是Trace-Class神经网络（TNN）先验，贝叶斯的推论是Sell等人提出的。 [39]。在推理问题的背景下，这种先验是对经典体系结构的更强大替代品。对于这项工作，我们为此类模型开发了多级蒙特卡洛（MLMC）方法。 MLMC是一种流行的差异技术，在贝叶斯统计和不确定性定量中具有特殊应用。我们展示了在[4]中引入的特定高级MLMC方法如何应用于DNN的贝叶斯推断并从数学上确定，即实现特定平方误差的计算成本，与后验预期相关，可以通过几个减少订单，与更常规的技术。为了验证此类结果，我们提供了许多关于机器学习中产生的模型问题的数值实验。其中包括贝叶斯回归，以及贝叶斯分类和增强学习。

translated by 谷歌翻译

Trace-class Gaussian priors for Bayesian learning of neural networks with MCMC

Torben Sell , Sumeetpal S. Singh

分类： (统计)机器学习

2020-12-20

本文介绍了一个新的神经网络，在$ \ mathbb r ^ d $的真实值函数之前，通过施工更容易和便宜地缩放到域维数$ d $与通常的karhunen-lo \`eve相比功能空间之前。新的先前是高斯神经网络，其中每个重量和偏差都有一个独立的高斯的先前，但是差异的关键差异是，差异在网络的宽度下减小，使得所得到的函数几乎肯定地定义了很多无限宽度网络的极限。我们表明，在推断未知功能的贝叶斯治疗中，使用希尔伯特Space Markov链蒙特卡罗（MCMC）方法，诱导的后续功能均可用于蒙特卡罗采样。这种类型的MCMC很受欢迎，例如，在贝叶斯逆问题文献中，因为它在网眼细化下稳定，即接受概率不会缩小到0美元，因为函数之前的更多参数甚至是AD Infinitum。在数值例子中，我们展示了其他功能空间前沿的这些竞争优势。我们还在贝叶斯加固学习中实施示例以自动化数据的任务，并首次演示MCMC的稳定性以对这些类型的问题进行网格细化。

translated by 谷歌翻译

BLOOM: A 176B-Parameter Open-Access Multilingual Language Model

Teven Le Scao , Angela Fan , Christopher Akiki , Ellie Pavlick , Suzana Ilić , Daniel Hesslow , Roman Castagné , Alexandra Sasha Luccioni , François Yvon , Matthias Gallé

分类：自然语言处理

2022-11-09

Large language models (LLMs) have been shown to be able to perform new tasks based on a few demonstrations or natural language instructions. While these capabilities have led to widespread adoption, most LLMs are developed by resource-rich organizations and are frequently kept from the public. As a step towards democratizing this powerful technology, we present BLOOM, a 176B-parameter open-access language model designed and built thanks to a collaboration of hundreds of researchers. BLOOM is a decoder-only Transformer language model that was trained on the ROOTS corpus, a dataset comprising hundreds of sources in 46 natural and 13 programming languages (59 in total). We find that BLOOM achieves competitive performance on a wide variety of benchmarks, with stronger results after undergoing multitask prompted finetuning. To facilitate future research and applications using LLMs, we publicly release our models and code under the Responsible AI License.

translated by 谷歌翻译

Estimation of Appearance and Occupancy Information in Birds Eye View from Surround Monocular Images

Sarthak Sharma , Unnikrishnan R. Nair , Udit Singh Parihar , Midhun Menon S , Srikanth Vidapanakal

分类：计算机视觉 | 机器人

2022-11-08

Autonomous driving requires efficient reasoning about the location and appearance of the different agents in the scene, which aids in downstream tasks such as object detection, object tracking, and path planning. The past few years have witnessed a surge in approaches that combine the different taskbased modules of the classic self-driving stack into an End-toEnd(E2E) trainable learning system. These approaches replace perception, prediction, and sensor fusion modules with a single contiguous module with shared latent space embedding, from which one extracts a human-interpretable representation of the scene. One of the most popular representations is the Birds-eye View (BEV), which expresses the location of different traffic participants in the ego vehicle frame from a top-down view. However, a BEV does not capture the chromatic appearance information of the participants. To overcome this limitation, we propose a novel representation that captures various traffic participants appearance and occupancy information from an array of monocular cameras covering 360 deg field of view (FOV). We use a learned image embedding of all camera images to generate a BEV of the scene at any instant that captures both appearance and occupancy of the scene, which can aid in downstream tasks such as object tracking and executing language-based commands. We test the efficacy of our approach on synthetic dataset generated from CARLA. The code, data set, and results can be found at https://rebrand.ly/APP OCC-results.

translated by 谷歌翻译

MAC: A Meta-Learning Approach for Feature Learning and Recombination

S. Tiwari , M. Gogoi , S. Verma , K. P. Singh

分类：机器学习

2022-09-20

基于优化的元学习旨在学习初始化，以便在一些梯度更新中可以学习新的看不见的任务。模型不可知的元学习（MAML）是一种包括两个优化回路的基准算法。内部循环致力于学习一项新任务，并且外循环导致元定义。但是，Anil（几乎没有内部环）算法表明，功能重用是MAML快速学习的替代方法。因此，元定义阶段使MAML用于特征重用，并消除了快速学习的需求。与Anil相反，我们假设可能需要在元测试期间学习新功能。从非相似分布中进行的一项新的看不见的任务将需要快速学习，并重用现有功能。在本文中，我们调用神经网络的宽度深度二元性，其中，我们通过添加额外的计算单元（ACU）来增加网络的宽度。 ACUS可以在元测试任务中学习新的原子特征，而相关的增加宽度有助于转发通行证中的信息传播。新学习的功能与最后一层的现有功能相结合，用于元学习。实验结果表明，我们提出的MAC方法的表现优于现有的非相似任务分布的Anil算法，约为13％（5次任务设置）

translated by 谷歌翻译

End-to-end deep learning for directly estimating grape yield from ground-based imagery

Alexander G. Olenskyj , Brent S. Sams , Zhenghao Fei , Vishal Singh , Pranav V. Raja , Gail M. Bornhorst , J. Mason Earles

分类：计算机视觉

2022-08-04

产量估计是葡萄园管理中的强大工具，因为它允许种植者微调实践以优化产量和质量。但是，目前使用手动抽样进行估计，这是耗时和不精确的。这项研究表明，近端成像的应用与深度学习相结合，以进行葡萄园中的产量估计。使用车辆安装的传感套件进行连续数据收集，并使用商业收益率监控器在收获时结合了地面真实收益数据的收集，可以生成一个23,581个收益点和107,933张图像的大数据集。此外，这项研究是在机械管理的商业葡萄园中进行的，代表了一个充满挑战的图像分析环境，但在加利福尼亚中央山谷中的一组常见条件。测试了三个模型架构：对象检测，CNN回归和变压器模型。对象检测模型在手工标记的图像上进行了训练以定位葡萄束，并将束数量或像素区域求和以与葡萄产量相关。相反，回归模型端到端训练，以预测图像数据中的葡萄产量，而无需手动标记。结果表明，在代表性的保留数据集上，具有相当的绝对百分比误差为18％和18.5％的变压器和具有像素区域处理的对象检测模型。使用显着映射来证明CNN模型的注意力位于葡萄束的预测位置附近以及葡萄树冠的顶部。总体而言，该研究表明，近端成像和深度学习对于大规模预测葡萄群的适用性。此外，端到端建模方法能够与对象检测方法相当地执行，同时消除了手工标记的需求。

translated by 谷歌翻译

Discovering novel systemic biomarkers in photos of the external eye

Boris Babenko , Ilana Traynis , Christina Chen , Preeti Singh , Akib Uddin , Jorge Cuadros , Lauren P. Daskivich , April Y. Maa , Ramasamy Kim , Eugene Yu-Chuan Kang

分类：计算机视觉 | 机器学习

2022-07-19

最近显示外部眼睛照片显示出糖尿病性视网膜疾病和HBA1C升高的迹象。在本文中，我们评估外部眼睛照片是否包含有关其他系统性医疗状况的信息。我们开发了一个深度学习系统（DLS），该系统将外部眼睛的照片作为输入，并预测多个全身参数，例如与肝脏有关的参数（白蛋白，AST）；肾脏（EGFR使用无种族的2021 CKD-EPI肌酐方程，尿液ACR）；骨与矿物质（钙）;甲状腺（TSH）;和血数（HGB，WBC，血小板）。开发利用了49,015例糖尿病患者的151,237张图像，在加利福尼亚州洛杉矶县的11个地点接受糖尿病眼镜筛查。评估重点是9个预先指定的全身参数，并利用了3个验证集（a，b，c），涵盖了28,869名患有和没有糖尿病的患者，在加利福尼亚州洛杉矶县和大亚特兰大地区的3个独立地点进行了眼睛筛查。我们将结合了可用临床人口统计学变量的基线模型（例如年龄，性别，种族/种族，糖尿病年）进行了比较。相对于基线，DLS在检测AST> 36，钙<8.6，egfr <60，HGB <11，血小板<150，ACR> = 300和WBC <4时，在检测AST> 36，钙<8.6，Egfr <60，HGB <60，HGB <60，calcium <8.6，Egfr <60，calcium <8.6和wbc <4时，达到了统计学上的显着性能，并且类似于开发集的人口），其中DLS的AUC超过基线的AUC，增长了5.2-19.4％。在验证集B和C方面，与开发集相比，患者人群的差异很大，DLS的表现优于ACR> = 300的基线，而HGB <11升至7.3-13.2％。我们的发现提供了进一步的证据，表明外部眼睛照片包含跨越多器官系统的全身健康生物标志物。需要进一步的工作来研究这些生物标志物是否以及如何转化为临床影响。

translated by 谷歌翻译

Few-shot bioacoustic event detection at the DCASE 2022 challenge

I. Nolasco , S. Singh , E. Vidana-Villa , E. Grout , J. Morford , M. Emmerson , F. Jensens , H. Whitehead , I. Kiskin , A. Strandburg-Peshkin

分类：机器学习

2022-07-14

尽管只有几个兴趣类的示例，但很少有声音事件检测是检测声音事件的任务。该框架在生物声学中特别有用，在生物声学中，通常需要注释很长的录音，但是专家注释时间是有限的。本文概述了Dcase 2022 Challenge中包含的第二次发射生物声音事件检测任务的第二版。介绍了任务目标，数据集和基准的详细描述，以及所获得的主要结果以及提交系统的特征。该任务收到了15个不同团队的提交，其中13个得分高于基线。最高的F-评分在评估集中为60％，这对去年的版本有了巨大的进步。高度表现的方法利用了原型网络，转导学习，并解决了所有目标类别的事件长度。此外，通过分析每个子集的结果，我们可以确定系统面临的主要困难，并得出结论，很少有展示的生物声音事件检测仍然是一个开放的挑战。

translated by 谷歌翻译

On the modern deep learning approaches for precipitation downscaling

Bipin Kumar , Kaustubh Atey , Bhupendra Bahadur Singh , Rajib Chattopadhyay , Nachiket Acharya , Manmeet Singh , Ravi S. Nanjundiah , Suryachandra A. Rao

分类：机器学习

2022-07-02

基于深度学习（DL）的降尺度已成为地球科学中的流行工具。越来越多的DL方法被采用来降低降水量的降水量数据，并在局部（〜几公里甚至更小）的尺度上产生更准确和可靠的估计值。尽管有几项研究采用了降水的动力学或统计缩减，但准确性受地面真理的可用性受到限制。衡量此类方法准确性的一个关键挑战是将缩小的数据与点尺度观测值进行比较，这些观察值通常在如此小的尺度上是无法使用的。在这项工作中，我们进行了基于DL的缩减，以估计印度气象部（IMD）的当地降水数据，该数据是通过近似从车站位置到网格点的价值而创建的。为了测试不同DL方法的疗效，我们采用了四种不同的缩小方法并评估其性能。所考虑的方法是（i）深度统计缩小（DEEPSD），增强卷积长期记忆（ConvlstM），完全卷积网络（U-NET）和超分辨率生成对抗网络（SR-GAN）。 SR-GAN中使用的自定义VGG网络是在这项工作中使用沉淀数据开发的。结果表明，SR-GAN是降水数据缩减的最佳方法。 IMD站的降水值验证了缩小的数据。这种DL方法为统计缩减提供了有希望的替代方法。

translated by 谷歌翻译

BigBIO: A Framework for Data-Centric Biomedical Natural Language Processing

Jason Alan Fries , Leon Weber , Natasha Seelam , Gabriel Altay , Debajyoti Datta , Samuele Garda , Myungsun Kang , Ruisi Su , Wojciech Kusa , Samuel Cahyawijaya

分类：自然语言处理

2022-06-30

培训和评估语言模型越来越多地要求构建元数据 - 多样化的策划数据收集，并具有清晰的出处。自然语言提示最近通过将现有的，有监督的数据集转换为多种新颖的预处理任务，突出了元数据策划的好处，从而改善了零击的概括。尽管将这些以数据为中心的方法转化为生物医学语言建模的通用域文本成功，但由于标记的生物医学数据集在流行的数据中心中的代表性大大不足，因此仍然具有挑战性。为了应对这一挑战，我们介绍了BigBio一个由126个以上的生物医学NLP数据集的社区库，目前涵盖12个任务类别和10多种语言。 BigBio通过对数据集及其元数据进行程序化访问来促进可再现的元数据策划，并与当前的平台兼容，以及时工程和端到端的几个/零射击语言模型评估。我们讨论了我们的任务架构协调，数据审核，贡献指南的过程，并概述了两个说明性用例：生物医学提示和大规模，多任务学习的零射门评估。 BigBio是一项持续的社区努力，可在https://github.com/bigscience-workshop/biomedical上获得。

translated by 谷歌翻译